小模型训练效率狂飙100倍!Thinking Machine推“在线策略蒸馏”,OpenAI前CTO亲自点赞
近日,AI新锐团队Thinking Machine发布突破性训练方法——在线策略蒸馏(On-Policy Distillation),让小模型在特定任务上的训练效率提升高达50至100倍。该成果一经公布,即获前OpenAI首席技术官Mira Murati亲自转
machine thinki thinkingmachine 2025-10-28 12:23 1
近日,AI新锐团队Thinking Machine发布突破性训练方法——在线策略蒸馏(On-Policy Distillation),让小模型在特定任务上的训练效率提升高达50至100倍。该成果一经公布,即获前OpenAI首席技术官Mira Murati亲自转
machine thinki thinkingmachine 2025-10-28 12:23 1
简单来说,Tinker 是一个 API,用于帮开发者 / 研究人员微调语言模型。重要的是,在此过程中,你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,这将
tinker thinkingmachines thinki 2025-10-02 11:10 3
“My dear Mr. Bennet,” replied his wife, “how can you be so tiresome! You must know that I am thinking of his marrying one of them.
在AI领域的一次震撼曝光中,前OpenAI安全副总裁Lilian Weng疑似揭示了神秘新公司Thinking Machines的首个创新产品——一款专为AI训练设计的“手动调参仪表盘”。这一消息迅速引起了业界的广泛关注。
lilian thinkingmachines thinki 2025-05-26 19:25 16